English / ქართული /








ჟურნალი ნომერი 4 ∘ ანდრეას ნასტანსკისიმონ გელაშვილი
საშუალო შეწონილი მონაცემების სტანდარტული შეცდომა

სტატიაში განხილულია შერჩევითი საშუალო მონაცემების სტატისტიკური გაზომვის კონკრეტული ტექნიკა. სტანდარტული შეცდომა ქმნის კარგ საფუძველს საშუალო მონაცემების შესაფასებლად. შერჩეული ერთეულის (ნიმუშის) კვლევის შემთხვევაშინიმუშის გამოყენება ხდება როგორც მოსალოდნელი მნიშვნელობის საშუალო შეფასება მთლიანობაში. შერჩევის ფუნქციების და მათი ხარისხის ზომების დასადგენად სტატისტიკური პროგრამების გამოყენებისას გათვალისწინებული უნდა იყოს ის, რომ შეწონილი მონაცემებით ვხელმძღვანელობთ თუ შეფარდებითი მაჩვენებლებით. დადგინდა, რომ წონების მეთოდის გამოყენება ზრდის საშუალოს და სტანდარტული შეცდომების გაანგარიშების კომპლექსურობას. ამ ფაქტორების არგათვალისწინება გამოიწვევს არასწორ ვარიაციებსა და არასწორ სტანდარტულ შეცდომებს. ავტორების აზრით, გამოსავალს წარმოადგენს წონის სტანდარტიზაცია, რომელიც მიზნად ისახავს შერჩევის სწორი ფუნქციების მიღებას. აქვე წარმოდგენილია გადაჭრის კონკრეტული გზები, რომლებიც ტექნიკურად (პროგრამულად) მარტივად განხორციელებადია.

საკვანძო სიტყვები: სტატისტიკური საზომები; არითმეტიკული საშუალო; სტანდარტული შეცდომა; ვარიაციის კოეფიციენტი; შერჩევის ფუნქციები. 

შესავალი

საშუალო მნიშვნელობა, როგორც საშუალო სტატისტიკური მაჩვენებელი, გამოიყენება მახასიათებლის სიხშირის განაწილების საშუალო დონის, ანუ საშუალო მდგომარეობის აღსაწერად. შერჩევითი ნიმუშის კვლევის შემთხვევაში ნიმუშის საშუალოს გამოყენება ხდება როგორც მოსალოდნელი მნიშვნელობის შეფასება მთლიანობაში. სტანდარტული შეცდომა წარმოადგენს შეფასების ხარისხს. აქედან გამომდინარე, ხშირ შემთხვევაში ემპირიულ კვლევებში საშუალო შეფასება მოცემულია სტანდარტულ შეცდომასთან ერთად. შეფასების შეცდომა გამოწვეულია იმით, რომ შემთხვევითი საშუალოს გამოთვლისას გვაქვს შემთხვევითი შერჩევა, სადაც შეფასების შეცდომის შესაძლო ან სავარაუდო გამოვლენა შეფასების ძირითად მახასიათებელს წარმოადგენს. ამ კონტექსტში უნდა იყოს გათვალისწინებული მოხდა თუ არა საშუალოს გაანგარიშება პროპორციულ რაოდენობაზე.

ბიზნესის სფეროს ძირითადი მაჩვენებლების მაგალითზე, როგორიცაა კომპანიების წლიური მოგება ან  მფლობელთა და მმართველთა მიერ მიღებული წლიური შემოსავალი (მათ შორის თავისუფალი დასაქმებულების მაგალითზეც, როგორიცაა ექიმები), განსხვავება ნათელი ხდება. ასე შეიძლება გამოთვლილ იქნეს თითოეული კომპანიის ან თვითონ მესაკუთრეთა წლიური წმინდა შემოსავალი. ამ უკანასკნელ შემთხვევაში განსხვავებულ თანაფარდობასთან გვაქვს საქმე. სტატისტიკური პროგრამების გამოყენებისას, შერჩევითი ფუნქციების და მათი ხარისხის ზომების დადგენისას ეს ფაქტი აუცილებლად უნდა იყოს გათვალისწინებული. გარდა ამისა, წონების მეთოდის გამოყენებამ შეიძლება კიდევ უფრო გაზარდოს საშუალოსა და სტანდარტული შეცდომების გამოთვლის სირთულე. გამოსავალი არის წონასწორობის სტანდარტიზაცია  შერჩევის სწორი ფუნქციების მისაღებად.

სტატიაში ნაჩვენებია არითმეტიკული საშუალოს სტანდარტული შეცდომის გაანგარიშება და შესაძლო შეცდომის წყაროები, საშუალო და სტანდარტული შეცდომების წარმოებისას. შემდეგ წარმოდგენილია სწორი და არასწორი სტანდარტული შეცდომების პრობლემები წონების მეთოდის გამოყენებისას და გადაჭრის გზები, რომლებიც პროგრამულად და ტექნიკურად მარტივად განხორციელებადია. ამას მოყვება ქვეჯგუფის დონეზე არსებული სტანდარტული წონის გაანგარიშების გამოსახვა (მაგალითად, სხვადასხვა დარგის კომპანიები) თანაფარდობისა და არათანაფარდობის რაოდენობებისთვის.

საშუალო და სტანდარტული შეცდომა თანაფარდობის დროს

ჩვენ კვლევაში თანაფარდობა განისაზღვრება როგორც ორი ლოგიკურად დაკავშირებული სტატისტიკური მაჩვენებელი. გაწარმოებული მაჩვენებლის სტანდარტული შეცდომა გამოითვლება მისი შეფასებული ვარიაციის საშუალებით. სტატისტიკური პროგრამების გამოყენებისას, როგორიცაა, მაგალითად, SPSS, შესაძლოა წარმოქმნილ იქნეს შემდეგი პრობლემები თანაფარდობებისა და მათი სტანდარტული შეცდომების საშუალო მაჩვენებლების გამოთვლისას:

ü  იმ შემთხვევაში, თუ საშუალო ფუნქცია გამოიყენება წონის გარეშე, ანუ გამოითვლება თანაფარდობის მარტივი საშუალო არითმეტიკული, კომპანია 1 მილიონი ევროს წლიური ნამატითა და 10 მფლობელით მიიღებს იგივე წონას საშუალო მაჩვენებლის წარმოებისას, როგორსაც კომპანია 1 მფლობელითა და 100,000 ევროს წლიური ნამატით. შედეგად, ამ პრინციპით მიღებული საშუალო მაჩვენებელი ზემოქმედებას არ იქონიებს მახასიათებლის „წლიური ნამატი თითოეულ მფლობელზე“ ემპირიული სიხშირის განაწილების საშუალო დონეზე. ეს შეუწონავი საშუალო მაჩვენებელი იქნება გათვალისწინებული ასევე შერჩევითი ვარიაციის, ანუ შერჩევითი სტანდარტული გადახრისა და შემდგომში ასევე სტანდარტული შეცდომის გამოთვლისას.

საშუალო და სტანდარტული შეცდომა თანაფარდობისა და შეწონილი მონაცემების დროს

საშუალო მნიშვნელობისა და სტანდარტული შეცდომის თანაფარდობის გამოთვლის დროს შერჩევითი ნიმუშის კვლევებმა შეიძლება გამოიწვიოს საწარმოების წონასწორობის პრობლემა ერთობლიობის სტრუქტურული მახასიათებლების მიხედვით. ნიმუშების დაგეგმვისა და ემპირიულად დაკვირვებადი სექტორების მიხედვით ცვალებადი მაჩვენებლების გამო, არსებობს ცენტრალური სტრუქტურული მახასიათებლის გადახრები განაწილებაში (მაგალითად, საწარმოო კომპოზიცია) შერჩეულ კომპანიასა და კომპანიათა ერთობლიობას შორის. ამ გადახრების დასაბალანსებლად შეგვიძლია მხედველობაში მივიღოთ მონაწილე კომპანიების წონა. ამის გამო ზოგიერთი შერჩევითი კომპანიის მიერ ეს მაჩვენებლები უფრო ძლიერად შეფასდება და ზოგიერთი კომპანიის მიერ კი უფრო სუსტად. ამ შემთხვევაში გამოიყენება განსაზღვრული სიხშირეების ექსტრაპოლაცია, როგორც კუთხობრივი მაჩვენებლების ერთობლივ სტრუქტურასთან შესათავსებლად. ეს მიდგომა გავლენას ახდენს არა მხოლოდ სიხშირის განაწილებაზე, არამედ აღსაწერ სტატისტიკურ მაჩვენებლებზე როგორიცაა საშუალო, გავრცელებული ზომები და შეფასების ხარისხის მაჩვენებლები. ამ ტიპის მაჩვენებლის მაგალითს წარმოადგენს წლიური ნამატი (შეწონილ საშუალოს თითოეულ მეწარმეზე).

საშუალო და სტანდარტული შეცდომა არათანაფარდობისა და შეწონილი მონაცემების დროს

შეწონვის პროცედურების შედეგად ვლინდება არასწორი სტანდარტული შეცდომის გამოთვლის პრობლემა ქვედა დონეებზე, ასევე არათანაფარდობის პირობებშიც, რადგან შეწონილი ჯამების რაოდენობის საშუალებით ხდება ქვეჯგუფებზე (აქ: სექტორები) გაყოფა. თუმცა, ეს მონაცემები გადახრილია თითოეული ქვეჯგუფის სტატისტიკური ერთობლიობის რაოდენობიდან. სტანდარტული შეცდომის, თითოეულ კომპანიაზე საშუალო წლიური ნამატის, საწარმოს დონეზე განსაზღვრისას სტანდარტიზებული წონა უნდა იქნას გამოყენებული.

დასკვნა

საწარმოს ეკონომიკაში ისეთი კოეფიციენტი, როგორიცაა წლიური შემოსავალი თითოეულ მფლობელზე, წარმოადგენს მფლობელთა მიერ მართული კომპანიის ეკონომიკური სიტუაციის ცენტრალურ ინდიკატორს. (შეფასებული) შედარებითი სტანდარტული შეცდომა წარმოადგენს საფუძველს მოცემული საშუალო მონაცემების ღირებულების შესაფასებლად. ზოგადად არსებობს ურთიერთდამოკიდებულება, რომ რაც უფრო პატარა ხდება სტანდარტული შეცდომა, მით უფრო დიდია შერჩევითი ნიმუშის ზომა. შერჩევის ფუნქციებისა და მათი ღირებულების მასის განსაზღვრისას, სტატისტიკური პროგრამების გამოყენებისას, გათვალისწინებულ უნდა იქნეს ის, რომ მოცემული გვაქვს კოეფიციენტები, თუ შეწონილი მონაცემები. ამ ფაქტორების გაუთვალისწინებლობამ შესაძლოა გამოიწვიოს ცვლილებები ვარიაციის შეფასებაში, სტანდარტულ შეცდომასა და ვარიაციის კოეფიციენტებში. გამოსავალს წარმოადგენს წონასწორობის სტანდარტიზაცია იმ მიზნით, რათა მივიღოთ არაცვალებადი (ადეკვატური) შერჩევის ფუნქციები.

Standardfehler von Durchschnitten für gewichtete Date

Der Standardfehler bildet die Grundlage zur Einschätzung der Güte geschätzter Mittelwerte wie dem Durchschnitt. Im Fall einer Stichprobenerhebung wird der Stichprobendurchschnitt als Schätzer für den Erwartungswert in der Grundgesamtheit herangezogen. Bei der Anwendung von Statistikprogrammen zur Ermittlung der Stichprobenfunktionen und deren Gütemaße muss beachtet werden, ob Verhältniszahlen oder gewichtete Daten vorliegen. Die Nutzung eines Gewichtungsverfahrens kann die Komplexität der Durchschnittsbildung und Standardfehlerberechnung erhöhen. Aus der Nichtberücksichtigung dieser Faktoren können verzerrte Varianzschätzer und Standardfehler resultieren. Als Ausweg wird eine Normierung der Gewichte vorgestellt – mit dem Ziel, unverzerrte Stichprobenfunktionen zu erhalten. Hierbei werden Lösungswege präsentiert, die auch programmiertechnisch einfach umzusetzen sind.

Keywords: Statistische Maßzahlen; Arithmetische Mitte;, Standardfehler; Variationskoeffizient; Stichprobenfunktionen.

JEL Codes: C10, C20, C29

    Einleitung

Mittelwerte wie der Durchschnitt sind statistische Maßzahlen zur Beschreibung des mittleren Niveaus bzw. der mittleren Lage der empirischen Häufigkeitsverteilung eines Merkmals.[1] Im Fall einer Stichprobenerhebung wird der Stichprobendurchschnitt als Schätzer für den Erwartungswert in der Grundgesamtheit herangezogen. Der Standardfehler repräsentiert dabei ein Maß für die Güte des Schätzers. In empirischen Untersuchungen wird daher in vielen Fällen der Mittelwertschätzer zusammen mit seinem Standardfehler angegeben. Der Fehler des Schätzers kommt dadurch zustande, dass bei der Berechnung des Stichprobendurchschnitts eine Zufallsstichprobe vorliegt, wobei das mögliche oder wahrscheinliche Auftreten eines Schätzfehlers das Wesensmerkmal einer Schätzung darstellt.[2] In diesem Zusammenhang muss berücksichtigt werden, ob der Durchschnitt über eine Verhältniszahl gebildet wurde.[3]

Am Beispiel aus der Betriebswirtschaftslehre bekannten Kennzahlen wie dem Jahresüberschuss von Inhaber-geführten Unternehmen (u.a. Freiberufler wie Ärzte) wird der Unterschied deutlich. So kann der Jahresüberschuss je Unternehmen bzw. je Inhaber berechnet werden. Im letzteren Fall liegt eine Verhältniszahl vor. Bei der Anwendung von Statistikprogrammen zur Ermittlung der Stichprobenfunktionen und deren Gütemaße muss diesem Fakt Rechnung getragen werden. Darüber hinaus kann die Nutzung eines Gewichtungsverfahrens die Komplexität der Durchschnittsbildung und Standardfehlerberechnung weiter erhöhen. Als Lösung bietet sich eine Normierung der Gewichte an, um korrekte Stichprobenfunktionen zu erhalten.

Im Folgenden wird die Berechnung des Standardfehlers des arithmetischen Mittels dargelegt und es werden mögliche Fehlerquellen bei der Durchschnitts- und Standardfehlerbildung bei Verhältniszahlen aufgezeigt. Anschließend werden die Probleme korrekter Standardfehler bei Anwendung eines Gewichtungsverfahrens vorgestellt und ein Lösungsweg präsentiert, der auch programmiertechnisch einfach umzusetzen ist. Dem folgt die Darstellung der Berechnung von Normgewichten auf Subgruppenebene (z.B. Unternehmen unterschiedlicher Branchen) für Verhältnis- und Nicht-Verhältniszahlen.


 1. Vgl. Rönz / Strohe (1994), S. 247. 2. Vgl. Schira (2012), S. 427. 3. Nastansky (2016) verdeutlicht diese Problematik am Bespiel der Berechnung von Standardfehlern  für zentrale Finanzkennzahlen im Zi-Praxi-Panel.

  Standardfehler

Der Standardfehler oder Stichprobenfehler ist ein durch die Stichprobenziehung bedingter Auswahlfehler. Statistisch repräsentiert der Standardfehler  ein Streuungsmaß für die durchschnittliche Größe des Stichprobenfehlers der Stichprobenstatistik (z. B. arithmetisches Mittel  der Stichprobe). Bei einem erwartungstreuen Schätzer reduziert sich der mittlere quadratische Fehler auf die Varianz der Schätzfunktion.[4] Damit liefert er eine Aussage über die Güte des geschätzten Parameters in der Stichprobe.

      (1)      

In (1) ist der Standardfehler des arithmetischen Mittels  abgebildet. Dessen Standardfehler ist üblicherweise unbekannt und muss ebenfalls aus der Stichprobe geschätzt werden. Als Schätzer für die unbekannte Standardabweichung der Grundgesamtheit wird die Stichprobenstandardabweichung  herangezogen. Der Standardfehler hängt vom Umfang der Stichprobe n und der geschätzten Streuung des zu untersuchenden Merkmals ab.[5] Es gilt allgemein: Je größer der Stichprobenumfang bzw. je kleiner die geschätzte Varianz des Merkmals, desto kleiner ist der Standardfehler. Die Berechnung des (geschätzten)[6] Standardfehlers setzt jedoch voraus, dass die Stichprobe das Ergebnis einer Zufallsauswahl ist.


 4. Vgl. Schlittgen (2011), S. 296. 5. Vgl. Ananiashvili (2014), S. 6. Im Weiteren wird auf die korrekte Bezeichnung geschätzter Standardfehler verzichtet.

Der relative Standardfehler  normiert den Stichprobenfehler auf den geschätzten Parameter (z. B. Stichprobenmittelwert) und erzeugt so ein dimensionsloses und damit auch für Vergleiche geeignetes Gütemaß. Der Ausdruck (2) entspricht dem (geschätzten) Variationskoeffizienten  des Stichprobendurchschnitts.

           (2)      

Bei der Berechnung des (relativen) Standardfehlers wird bei einer Stichprobe ohne Zurücklegen zusätzlich eine Endlichkeitskorrektur vorgenommen.

                  

Für einen hinreichend großen Umfang der Grundgesamtheit N bzw. für einen kleinen Auswahlsatz n/Nnimmt der Term der Endlichkeitskorrektur einen Wert nahe Eins an und der relative Standardfehler in (3) entspricht dem in (2). Liegt der Auswahlsatz unter 5%, so ist die Endlichkeitskorrektur in der Regel vernachlässigbar.[7]

 Durchschnitt und Standardfehler bei Verhältniszahlen

Eine Verhältniszahl ist als Quotient zweier sachlogisch verbundener statistischer Zahlen definiert.[8] Der Standardfehler dieser abgeleiteten Kennzahl wird über dessen geschätzte Varianz berechnet. Bei der Nutzung von statistischer Software wie SPSS können folgende Probleme bei der Berechnung von Mittelwerten von Verhältniszahlen und deren Standardfehlern auftreten:

  • Wird die Mean-Funktion ohne Gewichtung angewendet, d.h. ein einfaches arithmetisches Mittel der Verhältniszahl berechnet, erhält ein Unternehmen mit einer Million Euro Jahresüberschuss und 10 Inhabern das gleiche Gewicht bei der Mittelwertbildung wie ein Unternehmen mit einem Inhaber und 100000 Euro Jahresüberschuss. In der Folge reflektiert ein derart gebildeter Mittelwert nicht das mittlere Niveau der empirischen Häufigkeitsverteilung des Merkmals Jahresüberschuss je Inhaber.
  • Dieser ungewogene Mittelwert fließt auch in die Berechnung der Stichprobenvarianz bzw. der Stichprobenstandardabweichung und im Weiteren auch in den Standardfehler ein.

Bei der Berechnung des Durchschnitts und des (relativen) Standardfehlers von Verhältniszahlen (X = A / B) kann theoretisch wie folgt vorgegangen werden:

  1. Die Ermittlung des Stichprobendurchschnitts kann über zwei Wege erfolgen: zum einen über die Zähler- und Nennersumme der Verhältniszahl X der n Unternehmen der Stichprobe und zum anderen über ein gewogenes arithmetisches Mittel mit der Nennergröße der i-ten statistischen Einheit als Gewichte.

                                     

  1. Berechnung der Stichprobenstandardabweichung mit dem (gewogenen) Stichprobendurchschnitt.


                                                                                                                         (5)3. Berechnung des relativen Standardfehlers des Stichprobenmittelwertes der Verhältniszahl unter Berücksichtigung der gültigen Fallzahl n dieser Kennzahl.

                                                                                                                        (6)                   

  1. Berücksichtigung der Endlichkeitskorrektur.

                                                                           (7) Bei der Anwendung der Funktion gewichteter Mittelwert in vielen statistischen Programmen wird der Mittelwert korrekt berechnet, jedoch nicht die Varianz bzw. Standardabweichung und der Standardfehler. Die Ursache ist darin begründet, dass bei der Standardfehlerberechnung durch einen falschen Stichprobenumfang (Summe der Gewichte bi) geteilt wird. In unserem Beispiel entspricht dies der Summe der Inhaber. Da in der Praxis Unternehmen mehr als einen Inhaber haben können, übersteigt die Summe der Inhaber die Anzahl der Unternehmen. Richtigerweise muss bei der Stichprobenvarianz jedoch durch die Anzahl der statistischen Einheiten (hier: Unternehmen) abzüglich Eins dividiert werden. Bei der Standardfehlerberechnung muss die Wurzel aus dem Stichprobenumfang n und nicht aus der Summe der Gewichte bigezogen werden.

Als Lösung bietet sich eine einfache Transformation der Gewichte an. Über eine Normierung (8) wird sichergestellt, dass die Summe der Gewichte (Inhaberzahlen = Nennergröße der Verhältniszahl) mit der Anzahl der statistischen Einheiten (hier: Anzahl der Unternehmen) übereinstimmt.

                (8)      

Durch Multiplikation der praxisindividuellen Nennerwerte der Verhältniszahl mit dem Normfaktor g werden die normierten Gewichte erzeugt.

        (9)      

An dieser Stelle sei darauf hingewiesen, dass für die Berechnung des arithmetischen Mittels gemäß (10) keine Normierung der Nennerwerte der Verhältniszahl vorgenommen werden muss. Die Anwendung normierter und nicht-normierter Gewichte führen zu identischen Mittelwertschätzungen, da der sowohl im Zähler als auch im Nenner auftretenden Faktor biherausgekürzt wird. Im Kontrast dazu resultiert aus der Schätzung der Standardabweichung mit nicht-normierten Gewichten bei Verhältniszahlen eine verzerrte Varianzschätzung des gewogenen Durchschnitts, da die Summe der Gewichte vom Stichprobenumfang abweicht. Aufgrund der Subtraktion von Eins im Nennerterm in (5) ist der Faktor bi   nicht kürzbar. Diese Korrektur dient der Herstellung der Erwartungstreue der Stichprobenvarianz.[9]


 7. Vgl. Hartung  (2009), S. 275. 8. Vgl. Rönz / Strohe (1994), S. 394. [1]  9. Vgl. Schira (2012), S. 430f.

Dies bedeutet, dass sich bei der Existenz von Unternehmen mit mehreren Inhabern die Anzahl der Inhaber (Summe der Gewichte) von der Anzahl der Unternehmen (Stichprobenumfang) unterscheidet. Bei großen Stichprobenumfängen ist die Verzerrung in (5) gegenüber (11) jedoch vernachlässigbar. Auf einer möglichen Subgruppenebene, z.B. Unternehmen verschiedener Branchen, kann es in einer Stichprobe infolge der geringen Teilnahmerzahlen in einzelnen Subgruppen hingegen zu deutlichen Abweichungen in den geschätzten Varianzen und Standardfehlern kommen. 

Durchschnitt und Standardfehler bei Verhältniszahlen und gewichteten Daten

Zusätzlich zur Fragestellung der Mittelwertbildung und Standardfehlerberechnung bei Verhältniszahlen kann bei Stichprobenerhebungen das Problem der Gewichtung der Unternehmen nach Strukturmerkmalen der Grundgesamtheit auftreten. Aufgrund der Stichprobenplanung und empirisch zu beobachtenden über die Branchen differierende Rücklaufquoten kommt es zu Abweichungen in der Verteilung zentraler Strukturmerkmale (z.B. Branchenzusammensetzung) zwischen den Unternehmen der Stichprobe und den Unternehmen der Grundgesamtheit. Um diese Abweichungen auszugleichen, kann eine Gewichtung (Hochrechnung) der teilnehmenden Unternehmen vorgenommen werden. Damit werden die Angaben von einigen Stichprobenunternehmen stärker und von anderen Unternehmen schwächer gewichtet. In diesem Fall wird die Hochrechnung dazu genutzt, um bestimmte Häufigkeiten als Eckwerte an die Struktur der Grundgesamtheit anzupassen.[10] Dieses Vorgehen wirkt sich nicht nur auf die Häufigkeitsverteilung, sondern auch auf beschreibende statistische Kennzahlen wie Durchschnitte, Streuungsmaße und Gütekennzahlen der Schätzer aus. Ein Beispiel für eine derartige Kennzahl repräsentiert der (gewichtete) Durchschnitt des Jahresüberschusses je Inhaber.

Bei der Mittelwertbildung von Verhältniszahlen unter Einbeziehung von Gewichten einer Hochrechnung kann in Anlehnung an Abschnitt 3 folgendes Vorgehen gewählt werden:

  1. Berechnung des (gewichteten) Stichprobendurchschnitts als gewogenes arithmetisches Mittel mit den Nennergrößen der Verhältniszahl und den Gewichtungsfaktoren der Strukturgewichtung als Gewichte. Der unternehmens­individuelle Faktor wiergibt sich dabei aus dem Gewichtungsverfahren.

    2. Berechnung der (gewichteten) Stichprobenstandardabweichung mit dem (gewichteten) Stichprobendurchschnitt.

3. Berechnung des relativen Standardfehlers des (gewichteten) Stichproben­mittelwertes der Verhältniszahl unter Berücksichtigung der gültigen Fallzahl n dieser Kennzahl.

    4. Berücksichtigung der Endlichkeitskorrektur.

Erneut wird zwar das arithmetische Mittel korrekt berechnet, jedoch nicht die Varianz bzw. Standardabweichung und daraus abgeleitet der (relative) Standardfehler. Zum einen wird bei der Bestimmung der Stichprobenstandardabweichung durch ein Summenprodukt wibigeteilt, das nicht dem Stichprobenumfang entspricht und zu einem verzerrten Varianzschätzer in der Stichprobe führt.  Zum anderen tritt bei der Anwendung von Funktionen gewichteter Mittelwert in Programmen wie SPSS bei der Standardfehlerberechnung das Problem  auf, dass durch einen falschen Stichprobenumfang (Summe der Gewichte wibi) dividiert wird. In unserem Beispiel entspricht dies der Summe der gewichteten Inhaberzahlen. Richtigerweise muss jedoch durch die Anzahl der statistischen Einheiten (Unternehmen) bzw. dessen Wurzel dividiert werden.[11]

Als Lösung bietet sich erneut eine Normierung der Gewichte an. Über (18) wird sichergestellt, dass die Summe der Gewichte (Produkt aus der Nennergröße der Verhältniszahl, bi, und den Gewichtungsfaktoren aus der Strukturgewichtung, wi) mit der Anzahl der statistischen Einheiten übereinstimmt.

Durch Multiplikation der unternehmensindividuellen Nennerwerte der Verhältniszahl und den Gewichtungsfaktoren wi mit dem Normfaktor g* werden die normierten Gewichte erzeugt.

 Diese gehen anschließend in die Berechnung des Stichprobenmittelwertes (20), der Stichprobenstandardabweichung (21) und der (relativen) Standardfehler (22 bzw. 23) wie folgt ein:

Wenn die Summe der Gewichte aus dem Strukturgewichtungsverfahren dem Stichprobenumfang entspricht, d.h. es gilt, reduziert sich das Problem der korrekten Standardfehlerberechnung auf den Fall im Abschnitt 3. Werden hingegen Mittelwerte und Standardfehler auf Subgruppenebene (z.B. Branchenebene) ausgewiesen, ist das Vorgehen (20) bis (23) zu befolgen.

Auf Branchenebene kann empirisch die Summe der Gewichte der Unternehmen einer Branche vom Stichprobenumfang (Anzahl der Unternehmen) der Branche nk abweichen, da eine Hoch- bzw. Untergewichtung von Unternehmen bestimmter Branchen erfolgen kann. Die Gleichungen (18) bis (23) müssen für eine Berechnung auf Subgruppenebene wie folgt angepasst werden:

Durch (24) wird sichergestellt, dass die Summe der Gewichte (Produkt aus Nennergröße der Verhältniszahl und Strukturgewicht) auf Subgruppenebene mit der Anzahl der statistischen Einheiten (hier: Anzahl der Unternehmen der Branche) übereinstimmt.

Mittels der Multiplikation der unternehmensindividuellen Nennerwerte der Verhältniszahl bi und den Gewichtungsfaktoren wimit den k Normfaktoren gk* werden die normierten Gewichte auf Unternehmensebene erzeugt.

Diese gehen anschließend in die Berechnung des Stichprobenmittelwertes (26), der Stichprobenstandardabweichung (27) und der (relativen) Standardfehler (28 bzw. 29) auf Subgruppenebene wie folgt ein:

Wie (26) darlegt, stimmen die normierten gewichteten Durchschnitte auf Subgruppenebene (hier: Branchenebene) mit den nicht-normierten gewichteten Mittelwerten überein. Demgegenüber würden aus einem Verzicht der Normierung der Gewichte auf Branchenebene bei Verhältniszahlen wie dem Jahresüberschuss je Inhaber verzerrte Varianzschätzer und Standardfehler resultieren. Aufgrund der Normierung entspricht auf Branchenebene die Summe der normierten Gewichte der Anzahl der Unternehmen der jeweiligen Branche, d. h. es  gilt: .

  Durchschnitt und Standardfehler bei Nicht-Verhältniszahlen

und gewichteten Daten

Als Folge eines Gewichtungsverfahrens tritt die Problematik der fehlerhaften Standardfehlerberechnung auf Subgruppenebene auch bei Nicht-Verhältniszahlen auf, da durch die Anzahl der Summengewichte auf der Subgruppenebene (hier: Branchen) geteilt wird. Diese weichen aber von der Anzahl der statistischen Einheiten der jeweiligen Subgruppe ab. Bei der Ermittlung des Standardfehlers des mittleren Jahresüberschusses je Unternehmen auf Branchenebene müssen ebenso normierte Gewichte verwendet werden. Im Gegensatz zum Vorgehen bei Verhältniszahlen wird auf die Gewichtung mit der Nennergröße bi verzichtet, sodass bei der Berechnung der Standardfehler wie folgt vorgegangen werden kann:

  1. Berechnung des (gewichteten) Stichprobendurchschnitts als gewogenes arithmetisches Mittel mit den Gewichtungsfaktoren der Strukturgewichtung als Gewichte. Der unternehmensindividuelle Faktor wiergibt sich dabei aus dem Gewichtungsverfahren.

 2. Berechnung der (gewichteten) Stichprobenstandardabweichung mit dem (gewichteten) Stichprobendurchschnitt.

   3. Berechnung des relativen Standardfehlers des Stichprobenmittelwertes der Nicht-Verhältniszahl unter Berücksichtigung der gültigen Fallzahl n dieser Kennzahl.

  4. Berücksichtigung der Endlichkeitskorrektur.

Das Vorgehen (30) bis (33) führt zu unverzerrten Stichprobenvarianzen und Standardfehlern, sofern die Summe der Gewichte wi aus dem Strukturgewichtungsverfahren sich zum Stichprobenumfang n ergibt. Soll zum Beispiel der Jahresüberschuss je Unternehmen über alle Unternehmen im ZiPP berechnet werden, können die nicht-normierten Gewichte des Gewichtungsverfahrens genutzt werden. Im Gegensatz dazu bedarf es einer Normierung der Gewichte, wenn Mittelwerte und deren Gütemaße auf Subgruppenebene (z.B. Branchenebene) bestimmt werden.[12] Durch (34) wird sichergestellt, dass die Summe der Gewichte auf Subgruppenebene mit der Anzahl der statistischen Einheiten (hier: Anzahl der Unternehmen der Branche) übereinstimmt.


 10. Von der Lippe (2012) zeigt dies am Beispiel des Zi-Praxis-Panels. 11. Vgl. Gelashvili (2017): Economics and Business, S. 65. 12. Vgl. Gelashvili (2017), S. 190.

  

Dabei gilt auf Subgruppenebene üblicherweise:       .

Durch Multiplikation der unternehmensindividuellen Gewichte mit den k Normfaktoren  gk werden die normierten Gewichte erzeugt.

   

Diese gehen anschließend in die Berechnung des Stichprobenmittelwertes (36), der Stichprobenstandardabweichung (37) und der (relativen) Standardfehler (38 bzw. 39) auf Subgruppenebene wie folgt ein:

   

Wie (36) zeigt, stimmen die normierten gewichteten Durchschnitte auf Subgruppenebene mit den nicht-normierten gewichteten Mittelwerten überein. Im Gegensatz dazu würden aus einem Verzicht der Normierung der Gewichte auf Branchenebene bei Nicht-Verhältniszahlen wie dem Jahresüberschuss je Unternehmen verzerrte Varianzschätzer und Standardfehler resultieren.

 Fazit

Verhältniszahlen wie der Jahresüberschuss je Inhaber repräsentieren in der Betriebswirtschaft zentrale Indikatoren der wirtschaftlichen Situation Inhaber-geführter Unternehmen. Der (geschätzte) relative Standardfehler bildet dabei die Grundlage zur Einschätzung der Güte der berichteten Mittelwerte. Allgemein gilt der Zusammenhang, dass der Standardfehler umso kleiner wird, je größer der Stichprobenumfang ist. Bei der Anwendung von Statistikprogrammen zur Ermittlung der Stichprobenfunktionen und deren Gütemaße muss beachtet werden, ob Verhältniszahlen und gewichtete Daten vorliegen. Aus der Nichtberücksichtigung dieser Faktoren können verzerrte Varianzschätzer, Standardfehler und Variationskoeffizienten resultieren. Als Ausweg wurde eine Normierung der Gewichte vorgestellt – mit dem Ziel, unverzerrte Stichprobenfunktionen zu erhalten.

Literatur:

  1. Ananiashvili, I. (2014). Econometrics. Tbilisi.
  2. Gelashvili, S. (2017). New Rules of Statistical Imputation for Interdependent Economic Time Series. Economics and Business, N 4, TSU, Tbilisi.
  3. Gelashvili, S. (2017). Statistical Forecasting in Economics and Business. I Book (in Georgian). Tbilisi.
  4. Hartung, J. (2009). Statistik. 15. Aufl., München.
  5. Nastansky, A. (2016). Berechnung von Durchschnitten und Standardfehlern unter Berücksichtigung gewichteter Daten am Beispiel der Finanzen im Zi-Praxis-Panel. In: Zi-Paper, Nr. 7.
  6. Rönz, B./ Strohe, H.G. (Hrsg.) (1994). Lexikon Statistik. Wiesbaden.
  7. Schira, J. (2012). Statistische Methoden der VWL und BWL: Theorie und Praxis. 4. Aufl., München.
  8. Schlittgen, R. (2012). Einführung in die Statistik: Analyse und Modellierung von Daten. 12. Aufl., München.